import re
from python_baway.common.xcommon import xcheck, xshow_list

xfile = open('ppt11_page30_nested_tags.html', 'r', encoding='utf8')
xtext = xfile.read()
xfile.close()

xregexp = re.compile(r'(<([^<>]+)>\s*<([^<>]+)>(.+?)</\3>\s*</\2>)', re.DOTALL)
xr = xregexp.findall(xtext)
xshow_list(xr)

xregexp = re.compile(r'(<(?P<tag1>[^<>]+)>\s*<(?P<tag2>[^<>]+)>(.+?)</(?P=tag2)>\s*</(?P=tag1))>', re.DOTALL)
xr = xregexp.findall(xtext)
xshow_list(xr)
